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مقاله علمی-ترویجی 


به سوی علوم ریاضی 


۵ ۴ص عمط 05۰/۱ 


جبرخطی و فن‌آوری 


فریبا نوحی! 


۲ گروه کامپیوتر: آموزشکده فنی و حرفه‌ای الزهرا. دانشگاه فنی و حرفه‌ای خراسان رضوی, مشهد. ایران 


رم تمصع ۵ نطام مه 


چکیده. دراین مقاله با زبان ساده تاریخچه‌ای از کاربردهای جبرخطی را در فن‌آوری روز جهان توضیح می‌دهیم. 
هدف آن است که با ذکر مثال‌هایی نشان دهیم ریاضیاتی که به نظر مقدماتی می‌رسد تا چه حد بر آنچه در 
دنبای ما مین گدزد تاثیر داشته است. 


۱ پیش‌گفتار 


رایات ها کیک کرو اس جیان را خی ورنک ان فکای را پایگرزی کی این سل قزر 
اش قخوه انتالال مین فک تفای و تخلافانهه خانایی شان له وس شپاریت ی قرازی ارقاط را به ما 
بیاموزد. ریاضی ابزار قدرتمندی است برای درک و نظم بخشیدن به زندگی. ریاضیات در جای‌جای زندگی ما 
حضور دارد. در کارهایی مانند اندازه گیری» شمردن, اقتصاد. مهندسی و نرم‌افزارها و همچنین در طبیعت حتی 
جایی که خود ما حضور نداریم. ریاضی می‌تواند به توضیح پدیده های طبیعی بپردازد و حتی احساساتی مانند 
درکما تیان را توت کین به فرل تزمایی برش اسفاه ردام دافنگا و ساوت راد ام تالا (و ترا 
ریاضیات زیباست. بلکه زیبایی نیز نوعی ریاضی است و این دو در هم تنیده هستند.» دکتر بریتز زیبایی را در 
فرآیند ریاضی یافته است. او می افزاید: «از دیدگاه من ریاضیات بسیار جالب است. از وقتی کودک بودم آن 
را دوست داشتم. گاهی: زیبایی و لذت ریاضی در مفاهیم» گاهی در نتایج و گاهی در تفاسپر آن است. سایر 
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وازگان کلیدی. چبر خطی اینترنت علم داده, پردازش تصویر. 
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۸ کش 
اوقات. این فرآیندهای فکری است که ذهن شمار را باز می‌کند. احساسی که طی این فرآیند می‌گیرید یا تنها 
کاری که در جریان است؛ مانند گم شدن در یک کتاب خوب» [۱]. 

با این مقدمه و ستایش ریاضیات به گوشه‌ای از تاریخچه حضور بی‌بدیل آن در تعدادی از عملکردهای روزانه 
و بسیار متداولی که امروزه همگان با آن در ارتباط هستیم می‌پردازيم. 

امروز زندگی ما بدون اینترنت معنا ندارد. ارتباط ریاضیات و اینترنت مانند ارتباط بین یک نویسنده و 
زبان است. کار یک نویسنده بدون زبان به سرانجام نمی‌رسد و نوشته‌هایش با تکامل زبان در ارتباط تنگاتنگ 
است. رایانه‌ها به کمک زبان ریاضی به وجود آمدند و دستگاه اعداد در مبنای دو امکان انجام محاسبات» پخش 
مورسقی قمایشن تضاوتر وزقر آنچه که ارو هو یادن تفت مک امه می‌کنی زا فراش آوود هقی 
این‌ها با دو حرف الفبای » و ۱ انجام می‌شود. قوانین منطق ریاضی عملکرد رایان‌ها؛ آدرس‌دهی اینترنتی و 
موتورهای جستجو را مدیریت می‌کنند. همچنین مدیریت داده‌ها و طراحی روش‌های امنیت شبکه نیز با استفاده 
از ریاضیات انجام می‌پذیرند. از سوی دیگر اینترنت و شبکه وب نیز زمینه مساعدی برای پیشرفت ریاضیات 
فراهم کرده‌اند و ریاضیدانان با استفاده از امکانات جستجو به آخرین دستاوردهای همکاران خود دسترسی دارند 
و اوطرتق ارتاط اییخرشی می‌ترانه به تایل انظر پپردازنده ووافم انم مماملای اس که بای هر نو طرف 
سوداور است. 

از سوی دیگر دنیای امروز دنیای داده‌هاست. داده‌هایی که قسمت اعظم آن در اینترنت تولید می‌شود و پردازش 
و استخراج اطلاعات از آنها جزم جدایی ناپذیری از حوزه مایی مانند اقتصاه؛ امتیت» مطالمانت اجتماهی و 
مانند ان است. بسیاری علوم دیگر نیز در دنیای امروزی ما و با توجه به نیازها شکل گرفته اند. در سراسر 
شهرها دوربین‌های مدار بسته برای کاربردهای مختلف جایگذاری شده‌اند و در هر لحظه تصاویری به مراکز 
مختلف ارسال می‌کنند. 

بکی اقا هاش بزاب دناعی کی آیته: شاعای کا ففاهای دای شیاین یب 
آنها سروکار دارد. در واقع در حیطه علم امروز جایی وجود ندارد که ردپایی از جبر خطی در آن پیدا نشده باشد. 
در این مقاله سعی دا دم با زبان ساده برخی کاربردهای جبرخطی را در حوزه فن‌آوری به خصوص سیستم وب» 
پردازش داده و فشرده سازی تصاویر بیان کنیم. در اینجا هدف توضیح ریاضی مسأله نیست و به چند و چون 
و چرایی رسیدن به الگوریتم‌های مورد بحث نمی‌پردازيم» حتی هدف توضیح آخرین دستاوردهای فن آوری و 
تاثیر ریاضی بر آنها نیست بلکه تنها با فکر مثال‌هایی نشان می‌دهیم که قضایای مقدماتی جبرخطی تا چه حد 
در پیشرفت فن‌آوری سهم دارند و در نتیجه بر زندگی روزمره ما تاثیر گذاشته‌اند. الگوریتم‌های جستجویی که در 
زیر به آنها می‌پردا زيم از اولین الگوریتم‌های طراحی شده به سبک امروزی بودند که در طول زمان تغییر کرده و 
به الگوریتم هایی بسیار کارآمدتر تبدیل شده اند. ولی سادگی ایده آنها شروع خوبی برای درک کارکرد موتورهای 


جبر خطی و فن‌آوری ۸۳ 
استفاده از جبر خطی در الگوریتم‌های جستجو 


در حوزه فن‌آوری معمولا فضاهایی که متغیرها و داد‌ها در آن قرار می‌گیرند. فضاهای برداری هستند. در 
نتیجه پردازش مسائل با استفاده از ابزارهای جبر خطی میسر می‌گردد. تقریباً تمام موتورهای جستجوی اصلی 
وب امروزی از تحلیل پیوند برای بهبود نتایج جستجوی خود استفاده می‌کنند. تحلیل پیوند نوعی تحلیل داده 
ای کت گزدگيی ارفا ط مها شا وبا فظیل م کقان ای وق و اما هتسار ایس وب 
برمبنای نظریه ماتریس ساخته شده است. روش تحلیل‌پیوند و پشتوانه‌ی آن یعنی جبرخطی به انقلابی در 
جستجوی وب منجر شد. به طوری که روش جستجوی پیش از روش تحلیل پیوند (قبل از ۱۹۹۸) در مقابل 
جستجوی با دقت قابل توجه پس از آن کاملا رنگ باخت. 

وقتی کاربری در جستجوی عبارت یا مطلبی است. از موتور جستجو انتظار دارد که صفحات مربوط با آن 
مطلب را به ترتیب اهمیت در دسترس وی قرار دهد. در حال حاضر وقتی در گوگل چیزی را جستجو می‌کنید این 
انتظار تا حد بسیار زیادی برآورده می شود. این قابلیت ناشی از وجود الگوریتم‌های جستجوی پیشرفته است 
که بر روش تحلیل پیوند استوارند. برای این که به اهمیت روش تحلیل پیوند پی‌ببريم برای یک دقیقه وضعیت 
جستجوی قبل از سال ۱۹۹۸را در نظر بیاورید. به دلیل تعداد بی‌شمار صفحات وب یک پرس و جو از یک 
موتور اغلب فهرست بسیار طولانی از صفحات حتی گاهی تا هزاران صفحه مرتبط را نشان می‌داد. کاربر 
می‌بایست این لیست بلند بالا را مرتب کرده و صفحاتی با بیشترین ارتباط را می‌یافت. واضح است که به دلیل 
وجود هرزنامه‌ها" ترتیب ارائه شده در نتیجه‌ی جستجو کمک کمی به کاربر می‌کرد. زیرا برای فریب یک موتور 
جستجو جهت تولید رتبه‌ی بالاتر از حد معمول برای یک صفحه هرزنگارها" به طور آزادانه از متاتگ‌ها استفاده 
می‌کردند و ادعا می‌کردند که صفحه آنها از عبارات جستجوی محبوبی برخوردار است» که البته این عبارات 
فرگو د تا نت اهر في شدتتم خر ایفضا شید آشازدیه این تکته مین پاش که متانک‌ها غبارانت کزقاهی 
در توصیف یک صفحه هستند که در خود صفحه ظاهر نمی‌شوند بلکه در کد آن صفحه وجود دارند. هرزنگارها 
همچنین عبارات جستجوی محبوب را در متون نامرئی (متن سفید روی زمینه‌ی سفید) بارها تکرار می‌کردند 
تا موتور جستجو را بفریبند. به این ترتیب کاربر با ترتیبی ساختگی از صفحات ظاهراً مرتبط با موضوع روبرو 
می‌شد که در واقع نشان از ارتباط واقعی و بیشتر با موضوع مورد نظر نبود. با ورود الگوریتم‌های جدید. 
متاتگ‌ها به تدریج در موتورهای جستجو بی‌اثر شدند. الگوریتم‌های هیتس"* و رتبه‌صفحه" اولین الگوریتم‌های 
تحلیل پیوند بودند که در حدود سال ۱۹۹۸ توسعه یافتند و هر دو به‌طور قابل ملاحظه‌ای فرآیند جستجو را 
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۸۴ ف. نوحی 

بهبود بخشیدند. البته هر دوی اين الگوریتم ها در طول زمان جای خود را به الگوریتم های بهتری دادند ولی از 
آنجا که آشنایی با آنها به درک چگونگی کار الگوریتم‌های جستجو و ریاضیات دخیل در انها کمک می‌کند. اين 
الگوریتم ها را به طور مختصر بررسی می‌کنيم. ابتدا به توصیف ساده‌ای از الگوریتم هیتس می‌پردازيم. 


اد الگوریتم هیتس. الگوریتم هیتس یک روش تحلیل پیوند است که جان کلاینبرگ" آن را به منظور تمرکز 
بر لیست‌های طویل و بدون قاعده جستجوها درصفحات وب ابدا ع کرد [۵]. او متوجه الگویی در بین صفحات 
وب شد. برخی صفحات مانند یک کانون " یا پرتال عمل می‌کردند زیرا پیوندهای خروجی زیادی داشتند و برخی 
دیگر مانند قلمرو" یا منبع یک موضوع عمل می‌کردند. زیرا به عنوان صفحاتی که حاوی اطلاعات مهمی درباره 
موضوع بودند. ارجاعات یا پیوندهای ورودی بسیاری داشتند. کلاینبرگ دریافت که به‌نظر می‌رسد کانون‌های 
خوب به سوی قلمروهای خوب اشاره می‌کنند و قلمروهای خوب به وسیله کانون‌های خوب مورد اشاره قرار 
می‌گیرند. بنابراین او به هر صفحه 7 بک امتیاز کانونی :/ و یک امتیاز قلمروی : اختصاص داد. در واقع 
ه‌ازای هر صفحه » در تکرار :1 امتیاز کانونی "70 و امتیاز قلمروی 0 به شکل زیر تعریف شدند: 
رن 9 ار راو س 2 
9 ره دز 9 رره:ژ 

که در اینجا رز نمایش یک ابر پیوند از صفحه 7 به صفحه ر است و 7 مجموعه همه ابرپیوندها است. او برای 
محاسبه امتیاز یک صفحه با امتیاز یکنواخت شروع کرد یعنی اگر 7 تعداد صفحات در یک همسایگی خاص 
از لیست مورد نظر باشد. قرار داد 


در اینجا منظور از همسایگی تمام صفحات لیست مورد نظر و تمام صفحاتی که از این لیست به آنها اشاره 
شده یا از انها به صفحات لیست اشاره شده است. می‌باشد و بسته به نیاز لیست مورد نظر می‌تواند شامل صد 
یا صدها هزار صفحه باشد. این امتیازها با قاعده تکراری فوق تا زمانی که به یک مقدار ایستا همگرا شوند. 
محاسبه می‌شوند ۰ با کمک جبر خطی می‌توانيم معادلات فوق را به شکل ماتریسی بنویسیم. فرض کنید (] و 
بردارهای ستونی به ترتیب حاوی امتیازات کانونی و قلمروی باشند و فرض کنید ‏ ماتریس مجاورت در 
مجموعه همسایگی باشد. یعنی 1 <- زر اگر صفحه # به صفحه ژ پیوند داشته باشد و در غیر این صورت 


0 كت ور در این صورت داریم 
رل و و ۱ و رآ ان 


۷ 


0 ۱۳/۰ 
*حاناط 


۹ 


جبر خطی و فن‌آوری ۸۵ 
و با انجام محاسباتی» به نتایج زیر می‌رسیم 
7 ره 2 


ای 


که در اینجا ,1*1 ماتریس کانونی"" و 1.17 ماتریس قلمروی"" نام دارند. وظیفه الگوریتم هیتس حل مسأله 
بردار ویژه 
8( ع ول ,هرد > هر[ 1 


خواهد بود» که در آن 2۱ پزرکترتخ مقدار ویژه بل رل (و #[) و 0 و ۱ بردارهای ویژه نظیر خواهند بود. 
علاوه بر جبرخطی مقدماتی که در الگوریتم هیتس به کار می رود. مسائل مهمی مانند همگرایی. وحود» یکتایی 
و محاسبه عددی این امتبازات هم وجود دارند که با استفاده از دانش ریاضی حل می‌شوند. 


۳۲ الگوریتم رتبه صفحه. هر دوی ایده گوگل و رتبه صفحه توسط سرگی برین"" و لاری پیج" زمانی که 
دانشجوی علوم کامپیوتر دانشگاه استنفورد بودند. شکل گرفت. هرچند امروزه الگوریتم‌های بسیار پیشرفته‌تری 
ابداع شده اند ولی توصیف الگوریتم رتبه‌صفحه می تواند درک موضوع را ساده‌تر کند. نام این الگوریتم یعنی 
کصف۳مع۳۲۵ هم به کلمه 0286 در 0226 ۷۵ اشاره دارد و هم نام 60 127۷7 با یک پرسش شروع می کنیم. 
گوگل چگونه صفحات وب را جستجو می کند؟ پاسخ این است که گوگل صفحات وب را با کمک رتبه‌بندی 
صفحات برای یافتن کلمات کلیدی مورد نظر جستجو می‌کند. رتب‌صفحه چیست؟ رتبه صفحه الگوریتمی بود 
که توسط جستجوگر گوگل برای رتبه‌بندی صفحات وب در نتایح موتورجستجوی خود استفاده می‌کرد و روشی 
برای اندازه گیری اهمیت صفحات وب بود [۳۰۲]. رتبه صفحه با شمارش تعداد و کیفیت پیوندهای ارجاع به 
یک صفحه کار می‌کرد تا تخمین تقریبی از اهمیت وب سایت را تعیین کند. فرض اساسی این بود که احتمالا 
وب‌سایت‌های مهم‌ترپیوندهای بیشتری از وب سایت‌های دیگردریافت خواهند کرد. برین و پیج روش بازگشتی 
شبیه به روش کلاینبرگ را استفاده کردند. از نظر آنها یک صفحه مهم بود اگر از سوی صفحات مهم دیگر به آن 
اشاره شود. یعنی از نظر انها اهمیت صفحه شما (امتیاز رتبه‌صفحه) مجموع امتیازات رتبه صفحه‌هایی است 
که به صفحه شما اشاره می‌کنند. برای تعریف ریاضی رتبه یک صفحه برین و پیج اینگونه استدلال کردند که 
وقتی یک صفحه مهم به چندین مکان اشاره می‌کند» وزن (رتبه‌ی) آن باید به طور متناسب بین صفحات توزیع 
شود. به عبارت دیگ آگریاهو به صفحه وب شما اشاره می کند. این خوب است. اما شما نمی بایست وزن 
(امتیاز) کامل آن را دریافت کنید زیراآنها به بسیاری از مکان‌های دیگر هم اشاره می‌کنند. اگر یاهو علاوه بر 


۳ تحص قاط 


ی ۲( 
۲ مت زمعه؟ 


1 27۷ 6 ۲ 


صفحه شما به 999 صفحه‌ی دیگر هم اشاره می‌کند آن گاه شما تنها اعتباری معادل 0.001 رتبه صفحه‌ی یاهو 
را به وست.می‌آووید. آنها با استفاده از این انده و اسدلال‌های ریاضی فرمول بارگشتی زير را پیشتیاد کردتن؛ 


۳ (1+ه) 
0 2 5 و1 
که در آن )7 رتبه صفحه ُ-ام در تکرار :1, ,] مجموعه صفحاتی که به صفحه ۶ اشاره می کنند و |ز0| تعداد 
پیوندهای خروجی صفحه 7 است. این الگوریتم نیز مانند هیتس از یک رتبه یکنواخت برای همه صفحات 
شروع می‌کند. یعنی اگر تعداد صفحات 7 باشد با *# -- 7/۳ شروع کرده و با تکرار آن را اصلاح می‌کند. اين 
فرآیند را می توان به کمک ماتریس‌ها نمایش داد. فرض کنید 1/۲ بردار ستونی رتبه‌صفحه در 8-امین تکرار 


باشد. در این صورت می‌توان معادلات فوق برای رتب‌صفحه را به شکل فشرده زیر نوشت: 
و ۲ 


که در آن 17 ماتریس ابرپیوندی با ستون‌های نرمال شده است (مجموع درایه های هر ستون برابر ۱ است)» 
یعنی 

1 
ازها 4 - زرم 


اگر پیوندی از صفحه ر به صفحه 7 باشد 
.در غیر این صورت 0 


در اینجا سعی می کنیم با یک مثال ساده مسأله را توضیح دهیم [۶]. 
پنج نفربا نام‌های ۸ »13 6 (1 و 17 را فرض کنید که برخی از آنها همدیگر را می‌شناسند و دوست هستند. 


ماتریس دوستی زیر را در نظر بگیرید. 


را و 1 

۶۵ 1 1 0 ۸ 
۶ 0 1/۶ ۱ 1 ]یس 
0 0 ۸0 0 1/4 0 
0 0 0 0 1/4 
0 1 1/3 0 1/4 ۲ 


با توجه به ستون‌های هر حرف درواقع این ماتریس نشان می دهد که 4 با هرچهار نفردیگر دوست است و 
به دوستی همه‌ی آنها وزن مساوی می دهد ر و (] هر کدام فقط یک دوست دارند 6 سه دوست دارد و ]1 


دو دوست دارد. دقت کنید که وزن دوستی‌ها ترانن اسگته بنایراین امتیاز دوستی برای 4 از این دیدگاه که چه 
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کسانی و با چه وزنی دوست او هستند» عبارت است از مجموع سطر ۸4. با این توضیح داریم: 


1 13 


۳)۸( - 2 ۳)8( - 


19 


۳)2( - 


بیایید ببینیم در نهایت چه کسی بیشترین امتیاز دوستی را دارد؟ در ابتدا شما به همه امتیاز برابر می‌دهید یعنی 


1 1 1 1 1 1 ۰ ۲ 
2 9 5 5 5۶ ۱ حال روس تکراری زير را به کار می‌بریم 


را ال اه 


که در آن 1 9 3 9 ‌ ۳ ۷۵ یعی ترانهاده ماتریس سطری اولیه. این همان روش توانی است؟" که 


مقدار ویژه غالب و بردار ویژه خاصی متناظر با آن را به ما خواهد داد. در اینجا منظور از مقدار ویژه غالب؛ 
مقدار ویژه‌ای مانند ۸ است که به ازای هر مقدار ویژه دیگر مانند ۰۸۸ ۸ > |۸/|. ثابت می‌شود که بردار ویژه‌ای 
5 درآیه‌های نامنفی متناظر با ۸ وجود دارد (قضیه ۱.۲ زیر را ببینید). 
این بردار ویژه را /1 می‌نامیم داریم 
- ۷۲ [] 
اگر [و ,۰۰۰ ,رن] < 7 آنگاه امتیاز نفر -ام برابر است با ز2. 
اکنون مفهوم دوستی را با پیوند در یک وبگاه جایگزین می‌کنیم. 
* وبگاه ۸ دوست وبگاه 77 است. اگر یک ابرپیوند به وبگاه 17 داشته باشد. 
گوگل با گشتن در وب متوجه می‌شود که چه کسی دوست چه کسی است. 
* تعداد "دوستان؟ یک وبگاه برابر است با تعداد پیوندهایی که در آن وبگاه مشاهده می‌شود. 
8 ماتریتن ل فز ال کفتن فر وب تساه مشود ورمی از ام که اه شوسقدان ویقه نورد نظر 
را محاسبه می‌کنیم تا تقریبی برای رتبه‌صفحه به دست آید. 
قضیه زیر که فرم اولیه آن برای ماتریس‌های با درایه‌های اکیدا مثبت توسط پرون*" و بعداً تعمیمی از آن توسط 


فروبینیوس" ثابت شده وجود بردار ویژه‌ای با درایه‌های نامنفی را برای مقدار ویژه غالب. تضمین می‌کند. 


قضیه ۰۱.۲ فر ضکنید (ز:«1) < 11 یک ماتریس مربعی حقیقی با درایه‌های نامنفی باشد. در این صورت 
مقدار ویژه نامنفی ۸ تراخن 11 وحود دار د که به ازای هر مقدار ویژه دیگر مانند ۰۸۸ ۸ ب ۳ و همچنین بردار 
ویژ‌ای متناظر با آن با درایه‌های نامنفی وجود دارد. ۸ یک ریشه ساده چند جمله‌ای مشخصه 7 است. 


۱۹22۹ ۵00۲ 


۵ ومع 


۴ مینم‌طمتع۴ 


۸۸ ف. نوحی 

البته اثبات وجود یک جواب و پیدا کردن جواب در عمل معمولاً دو مقوله جدا هستند و پیدا کردن روشی که 
منجر به یافتن جواب شود بسیار مهم است. در واقع روش تکراری فوق گاهی مشکل همگرایی و یا افتادن در 
دور دارد. برای حل این مشکل برین و پیج به اصلاح این روش پرداخته و با استفاده از ماتریس‌های تصادفی 
الگوریتم‌های دیگری برای یافتن پاسخ های مناسب ساختند. در اینجا به جزئیات کار نمی‌پردازيم بلکه به طور 
مختصر متذکر می‌شویم که در این روش‌ها درایه‌های ماتریس ۰17 احتمال وجود پیوند بین دو صفحه خواهند بود 
که پیدا کردن توزیع اين احتمال هم خود از اهمیت برخوردار است و پس از آن بایستی تغییرات مناسبی روی 
این ماتریس اعمال کرد تا همگرایی جواب را تضمین کند. این نشان می‌دهد که برای حل مسائلی از اين نوع 
دانش ریاضی اساس کار است و با طرح هر مساأله جدید سطح و پیچیدگی دانش مورد نیاز نیز بالاتر خواهد 
رفت. در واقع امروزه الگوریتم های بسیار پیشرفته‌تر به وجود آمده‌اند که کار جستجو را بسیار موثرتر و سریع‌تر 
انجام می‌دهند ولی بنیاد همه انها برقضایای ریاضی استوار است. 


بو تاو 
روش تحلیل مولفه‌های اصلی۱۷, 0۸ 
در جهان آمروز, روزانه داده‌های زیادی در سایت های اجتماعی مختلف تولید می‌شود. در واقع ۰ درصد از 
داده‌های امروزی در سه یا چهار سال گذشته تولید شده است. این داده‌ها برای جمع‌آوری اطلاعات مهم و مرتبط 
باید به درستی تجزیه و تحلیل شوند. ۳۸ تکنیک کاهش ویژگی برای استخراح ویژگی‌های غالب از داده‌ها 
است. به این معنی که یک مجموعه بزرگ از متغیرها را طوری به مجموعه کوچکتری کاهش می‌دهد که هنوز 
هم بیشتر ویژگی‌های مهم حفظ شده باشند. این ویژگی‌های استخراج‌شده به عنوان «مولفه‌های اصلی» شناخته 
می‌شوند. کاهش تعداد متغیرها می‌تواند به بهای کاهش دقت تمام شود ولی مزیت این روش این است که کمی 
از دقت را به عنوان بهایی در ازای ساده‌تر کردن مسأله می پردازد. زیرا پردازش داده‌های کمتر در الگوریتم‌های 
یادگیری ماشین ساده‌تر و سریع‌تر است و از وارد کردن داده‌های اضافی در محاسبات اجتناب می‌شود. این 
روش را می‌توان به شرح زیر توصیف کرد [۳]: 
مجموعه متغیرهای اولیه یک فضای برداری را تشکیل می‌دهند. 
هیک وله اشلی رکب مقطلی او مکفیرهای وله است: 
و مولفه‌های اصلی به گونه‌ای استخراج می‌شوند که اولین مولفه اصلی حداکثر واریانس در مجموعه داده 
را توصیف می‌کند. 
* مولفه اصلی دوم سعی می‌کند واریانس باقی ماند‌ی مجموعه داده را توصیف کند و با مقلفه اصلی 
اول همبستگی ندارد. 


۲۱۱8۵1۵18 )۵0۳۵۵0۳۴۵۵۶ 5 ۷ 
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9 مولفه اصلی سوم سعی می کند واریانسی را شرح دهد که با دو مولفه اصلی اول توصیف نمی‌شود. 
وبه همین ترئیب. 

1 حال چگونه مولفه اصلی را پیدا کنیم؟ از نظر 
هندسی مولفه‌های اصلی جهت‌هایی در فضای داده هستند که متناظر با مقادیر بیشین واریانس می‌باشند. به 
بان گر خطیطی کشت رنه اطعا دای وی دارگ قاط بین وا راید اطلاعا در سا نکر 
است که هر چقدر واریانس در طول یک خط بیشتر باشد» پراکندگی داده در طول آن بیشتر است و هرچقدر این 
پراکندگی بیشتر باشد به این معتی است که اطلاعات بیشتری روی آن قرار داره» ثابت:می‌شود که مولفه‌های 
اصلی بردارهای ویژه ماتریس کوواریانس مجموعه‌ی داده است. یعنی ماتریسی که دراه 4 آن کووا ریانس داده 
و داده ژ باشد. از آنجا که ()0۵۳ < (1 ,)00 و (1 ,6000 < ( ,)600 ماتریس حاصل یک ماتریس 
متقارن خواهد بود که روی قطر واریانس هر متغیر را دارد. هر بردار ویژه این ماتریس جهتی را نشان می‌دهد 
که بیشترین واریانس (اطلاعات) را در بر دارد و مقدار ویژه نظیر نیز مقدار این واریانس را به دست می‌دهد. با 
توجه به این که اغلب با داده‌های بزرگ سروکار داریمی محاسبه بردارها و مقادیر ویژه این ماتریس‌های بزرگ خود 
نیاز به الگوریتم‌های مفصلی دارد که با استفاده از قضایا و روش‌های ریاضی این کمیت‌ها را محاسبه می‌کنند. 


۴ فشرده سازی تصویر 


یک تصوير را می‌توان در یک ماتریس ذخیره کرد به‌طوری که هر درایه آن مقدار پیکسل نظیر آن باشد. به 
عنوان مثال یک عکس سیاه و سفید می تواند در فرمت ۳۸61 ذخیره شود که در آن هر پیکسل مقدار » یا ۱ 
را دارد. فرض کنید تصویری با اندازه 423 < 480 پیکسل داشته باشیم. یعنی ماتریسی مانند ۷ با اندازه 
3 * 480 داریم که درایه‌های آن » يا ۱ هستند. اين ماتریس را با کمک روش تجزیه مقدار منفرد" به 
صورت 7117 - 17 تجزیه می‌کنیم» که در آن 7] یک ماتریس یکانی 480 « ۲/۰480 یک ماتریس یکانی 
3 7۰ 423 و (1 یک ماتریس 423 « 480 است که دارای یک زیر ماتریس قطری ۲ « ۲ می‌باشد که به 
تعداد 7 از مقادیر منفرد 12 را روی قطر خود دارد دارد و سایر درایه‌های (1 صفرند. در اینجا منظور از مقادیر 
منفرد» ريشه دوم مقادیر ویژه (الزاما نامنفی) ماتریس متقارن 11 ۷/7 است. 

حال فقط با کمک ۳۰ مقدار منفرد اولیه تصویر را بازسازی می‌کنیم. تصویر دوم از نظر کیفی تفاوت زیادی 
با تصویر اول ندارد ولی با کاهش عناصر روی قطر به ۳۰ تا؛ به جای 203040 -- 423 < 480 پیکسل تعداد 
0 » 480 پیکسل در و 423 < 30 تا در 177 داریم. به این ترتیب 


7 - 3001 + 480 + 423( 


تعداد کل پیکسل‌ها خواهد بود که حدود 13 درصد مقدار اولیه است. فاشتکا ۱ دو تصویر )۱( و (ب) را 
مقایسه کنید: تصور کنید که موسسه‌ای با هزار کارمند هر روز بخواهد با استفاده از دوربین چهره افراد وارد شده 


۷ (5۷۲) عمتانکم‌مجومععل مله۷ عقاتاعمته 


۹۰ ف. نوحی 

به محل کار را شناسایی کند. این موسسه باید پایگاه داده‌ای حاوی حداقل چهار عکس از هر نفر داشته باشد 
یعنی ۴۰۰۰ عکس. در زمان ورود هر کارمند باید عکسی از او گرفته شود و با آنچه در پایگاه داده ذخیره شده 
مقایسه گردد. مسلما وقتی از روش فشرده سازی استفاده شده باشد تعداد پیکسل‌های مقایسه شونده به طور 
معنی داری کمتر و زمان مقایسه نیز کوتاهتر خواهد بود. 


(ا) قبل از فشرده‌سازی (ب) بعد از فشرده‌سازی 


شکل ۰۱ مقایسه دو تصویر 


۵ سخن پایانی 
مثال های فوق نمونه کوچکی از کاربردهای جبرخطی در فرآیند توسعه سریع علمی در روزگار ما هستند و 
این مثال‌ها خود به اشکال گوناگون در جاهای مختلفی نظیر مهندسی. پزشکی» اقتصاد و .۰.۰ کاربرد دارند. این 
نشان می‌دهد که اگر پیشرفت‌های تئوری ریاضی نبود جهان ما شکل دیگری داشت. 


وت 
[۱] م. میرزاخانی» پارادوکسی نزدیک به جادی 00۳/0/44ع860.10010-طاح//:دحاط. 
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